arXiv:1502.06493vl [math.HO] 7 Jan 2015 


Etude de 1’omnipresence des proprietes petit- 
monde et sans-echelle 


Vincent Labatut 

Universite Galatasaray, Qiragan cad. n°36, Ortakoy 34357, Istanbul, Turquie 
LIA, Universite d’Avignon, Agroparc BP 1228, 84911 Avignon Cedex 9, France 
vincent.labatut@univ-avignon.fr 


RESUME. Les proprietes petit-monde et sans-echelle out ete identifiees dans les reseaux com¬ 
plexes reels a la fin des annees 90. Leur etude a permis de faire progresser la comprehension 
de certains systemes, et elles ontfaitl 'objet de tres nombreux travaux. Peut-etre pour cette rai¬ 
son, on rencontre tres frequemment dans la litterature I’idee qu'il s’agirait de proprietes quasi- 
universelles, valables pour presque tous les reseaux complexes. Or, a notre connaissance, au- 
cune etude a grande echelle n ’a ete menee pour veritablement repondre a cette question. Dans 
ce travail, nous tirons parti, d’une part, de la grande quantite de donnees qui est maintenant 
disponible en ligne pour constituer une large collection de reseaux complexes, et d'autre part 
d’outils d’analyse definis recemment, pour eprouver objectivement cette hypothese d’omnipre¬ 
sence. 11 ressort que si une large majorite des reseaux trades est Men petit-monde, ce n ’est en 
revanche pas le cas pour la propriete sans-echelle, puisque le degre d'une proportion significa¬ 
tive de ces reseaux n’est pas distribue selon une loi de puissance. 

ABSTRACT. The small-world and scale-free properties were identified in real-world complex net¬ 
works at the end of the 90s. Their analysis led to a better understanding of the dynamics and 
functioning of certain systems, and they were studied in many subsequent works. This might be 
the reason why one frequently finds, in the complex networks literature, assertions regarding 
their ubiquity, their validity for almost all complex networks. Yet, the mentioned seminal works 
were conducted on a very limited number of networks, and, to the best of our knowledge, no 
large-scale study has been conducted to answer this question. In this work, we take advantage, 
on the one hand, of the many datasets now available online, to constitute a large collection of 
networks, and on the other hand, of recent analysis tools, to check the validity of this hypothesis 
of ubiquity. It turns out a large majority of the studied networks are indeed small-world, how¬ 
ever this is not the case for the scale-free property, since the degree distribution of a significant 
proportion of our networks does not follow a power-law. 

MOTS-CLES : Reseaux complexes, proprietes topologiques, petit-monde, sans-echelle. 

KEYWORDS: Complex networks, topological properties, small-world, scale-free. 





2 MARAMI2014. 


1. Introduction 


Des travaux fondateurs realises autour des annees 2000 on permis d’identifier dans 
les reseaux complexes des proprietes topologiques permettant de mieux comprendre le 
fonctionnement des systemes modelises. Les deux plus importantes sont certainement 
la propriete petit-monde, etudiee par Watts & Strogatz [WAT 98], et la propriete sans- 
echelle, traitee par Barabasi & Albert [BAR 99], qui seront toutes les deux decrites 
plus loin. 

A la suite de ces travaux, I’idee s’est progressive me nt repandue dans la litterature 
que ces proprietes etaient presentes dans la plupart des reseaux representant des sys¬ 
temes reels [BOC 06]. Pouitant, cette hypothese d’omnipresence pent sembler fragile, 
pour deux raisons. Tout d’abord, les etudes qui se sont attachees a verifier la preva¬ 
lence de ces proprietes sont basees sur un tres faible nombre de reseaux. Ainsi, les 
travaux fondateurs cites precedemment considerent tous les deux seulement 3 reseaux 
[WAT 98, BAR 99]. Les publications plus recentes utilisent des collections a peine 
plus grandes, constituees de 5 [LATOl], 7 [AMA 00], 9 [BOC 06], 11 [WAN 03], 
15 [NEW 02], 27 [NEW 03], 30 [ALB 02], 33 [HUM 08] reseaux. Ceci est princi- 
palement du au fait qu’a cette epoque, ce type de donnees etait extremement rare, 
et leur acces difficile. La seconde critique porte sur les methodes d’analyse utilisees, 
en particulier pour determiner la presence de la propriete sans-echelle, qui repose sur 
I’observation que le degre du reseau est distribue selon une loi de puissance. L’ope¬ 
ration consistant a identifier cette distribution est courante en sciences experimentales 
[NEW 05, NEW 11]. Des travaux methodologiques recents ont montre qu’elle etait 
generalement realisee de fa 9 on inappropriee, en raison de Tutilisation d’outils statis- 
tiques inadaptes et/ou appliques de fa 9 on incorrecte [NEW 05, CLA 09]. 

II est aujourd’hui possible de contourner ces deux limitations. En effet, avec le de- 
veloppement de notre champ de recherche, des centaines, voire des milliers de reseaux 
differents sont maintenant accessibles via le Web, a travers les sites des chercheurs, 
laboratoires et journaux. Le probleme principal qui se pose est de rassembler, nor- 
maliser et classifier ces donnees heterogenes et eparpillees, de maniere a constituer 
une base de donnees exploitable de fa 9 on automatique. Du point de vue methodolo- 
gique, la aussi, les outils permettant d’identifier la distribution du degre dans un reseau 
complexe existent, et la procedure a suivre a ete clairement etablie [CLA 09]. 

Dans cet article, nous nous proposons d’eprouver F hypothese d’omnipresence des 
proprietes petit-monde et sans-echelle dans les reseaux complexes representant des 
systemes reels. Nous constituons d’abord une large collection de reseaux, puis nous 
I’etudions au moyen de methodes d’analyse adequates. Dans la section suivante, nous 
rappelons brievement ce que sont ces deux proprietes qui nous interessent. Puis, dans 
la section 3, nous decrivons comment nous avons constitue notre collection de reseaux, 
avant d’aborder en section 4 les methodes d’analyse que nous avons utilisees pour 
I’etudier. Les resultats obtenus sont presentes dans la section 5. Ce travail peut-etre 
considere comme la premiere etape d’un projet a plus long terme, pour lequel nous 
donnons quelques pistes a explorer en guise de conclusion. 
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2. Proprietes topologiques 


De nombreuses proprietes topologiques sont aujourd’hui etudiees pour caracteri- 
ser des systemes reels, telles que la correlation du degre, la structure de communautes 
ou differents types de centralite decrivant aussi bien les nceuds que les liens. Nous 
nous concentrons, dans cette etude, sur les deux proprietes historiques citees dans F in¬ 
troduction ; la propriete petit-monde et la propriete sans-echelle, que nous decrivons 
brievement dans cette section. 


2.1. Petit-monde 


La propriete petit-monde a ete definie par Watts & Strogatz en se basant sur deux 
mesures topologiques [WAT 98]. D’une part, la distance geodesique moyenne, une 
caracteristique globule du reseau qui represente le niveau de separation typique entre 
deux nceuds. D’autre part, le coefficient de transitivite (ou coefficient de clustering), 
qui est local et correspond au niveau d’interconnexion dans le voisinage d’un noeud. 
Watts & Strogatz ont calcule ces mesures pour differents reseaux reels, et les ont 
comparees a celles attendues pour les deux principaux modeles du moment : d’un 
cote les structures de treillis, qui constituent une forme de graphes reguliers, et qui 
sont qualifies ici de completement ordonnes; et de F autre les reseaux aleatoires de 
type Erdos-Renyi [ERD 60], qui sont decrits ici comme completement desordonnes. 
Les premiers possedent une transitivite et une distance moyenne elevees, alors que 
pour les seconds, ces deux mesures sont petites. L’analyse a montre que les reseaux 
reels se situent quelque part entre ces deux extremes. Leur distance moyenne est petite, 
du meme ordre de grandeur que celle obtenue pour des reseaux aleatoires, et bien en- 
de 9 a de celle des treillis. Leur transitivite est elevee, du meme ordre de grandeur que 
celle d’un treillis, et bien au-dela de celle des graphes aleatoires. C’est la presence 
simultanee de ces deux caracteristiques que Watts & Strogatz ont qualifiee de propriete 
petit-monde. 

La propriete petit-monde a un effet sur les processus prenant place dans le systeme 
modelise. Watts & Strogatz ont illustre empiriquement qu’elle facilite les mecanismes 
de propagation dans le reseau. Par la suite, Latora & Marchiori ont montre de fa^on 
theorique que les reseaux petit-monde sont effectivement tres efficaces dans le trans¬ 
port d’information, a la fois aux niveaux local et global [LAT 01]. Ceci a des conse¬ 
quences directe sur le fonctionnement du systeme, qui dependent de sa nature. Ainsi, 
la vitesse de propagation d’une epidemie dans une population augmente; la capacite 
calculatoire d’un reseau d’automates cellulaires s’accroit; un ensemble d’oscillateurs 
se synchronise plus rapidement, ou oscille de fa 9 on plus coherente; Fapparition d’une 
propriete emergente telle que la collaboration dans une population de joueurs devient 
plus probable; etc. [WAT 98, LAG 00, LI 03]. L’etude de cette propriete constitue 
done un point important de Fanalyse d’un systeme reel. 
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2.2. Sans-echelle 

Dans leur etude bien connue [BAR 99], Barabasi & Albert ont observe que le degre 
k mesure sur plusieurs reseaux reels est distribue selon une loi de puissance P{k) ~ 
/c““. Autrement dit, le nombre de noeuds de degre k est proportionnel a une puissance 
de k. Ils ont qualifie les reseaux concernes de sans-echelle, en raison de la propriete 
qu’a cette fonction de conserve!' la meme forme quand son parametre est multiplie 
par une constante. Cependant, il faut noter que I’invariance d’echelle consideree dans 
cette etude ne conceme que le degre, et pas forcement les autres mesures que Ton 
peut calculer pour decrire un reseau (contrairement a ce que I’expression reseau sans- 
echelle pourrait laisser croire). 

Comme pour la propriete petit-monde, les modeles classiques du moment n’ex- 
pliquent pas cette distribution ; dans les graphes reguliers, le degre est par definition 
le meme pour tous les noeuds (loi degeneree), alors que pour les graphes aleatoires, 
il est distribue selon une loi de Poisson [ERD 60]. Dans les deux cas, il existe done 
une valeur caracteristique pour le degre, ce qui n’est pas le cas avec la loi de puis¬ 
sance. Or, la propriete sans-echelle a ete observee sur des reseaux modelisant des 
systemes reels tres differents : grille electrique, Web, reseau d’interactions sociales, 
Internet, etc. [BAR 99, NEW 03]. Pour Pexpliquer, Barabasi & Albert utilisent deux 
mecanismes absents des deux modeles classiques ; la croissance du systeme et Patta- 
chement preferentiel. Le premier implique que le reseau soit construit iterativement, 
par addition de nouveaux noeuds. Le second stipule que ces nouveaux noeuds ont ten¬ 
dance a se connecter a des noeuds deja existants de degre eleve. Il faut cependant noter 
que d’autres modeles tres differents ont ete proposes pour produire des reseaux sans- 
echelle [BOC 06], ce qui laisse supposer qu’il existe plusieurs mecanismes distincts 
amenant a Fapparition de cette propriete dans des systemes reels. 

La propriete sans-echelle a un effet direct sur la structure du reseau : une grande 
majorite de noeuds est tres faiblement connectee, alors qu’un nombre reduit possede 
un degre tres eleve, et sont consideres comme des pivots (hubs). Par comparaison, 
dans les modeles dont la distribution du degre est plus homogene, la probabilite d’ap¬ 
parition de ces valeurs extremes est particulierement faible. Grace a Fexistence de ces 
pivots, les reseaux sans-echelle opposent une meilleure resistance aux attaques alea¬ 
toires, consistant a tenter de partager le reseau en supprimant des noeuds au hasard. En 
revanche, ils sont plus vulnerables aux attaques concertees, qui se concentrent sur ces 
pivots [ALB 02]. En termes de propagation, les reseaux sans-echelles modelisant des 
systemes reels ont un seuil epidemiologique tres bas [BOC 06], ce qui signihe qu’une 
epidemie peut y survivre tres longtemps. Comme pour la propriete petit-monde, Feffet 
de la propriete sans-echelle sur le fonctionnement du reseau justihe la grande impor¬ 
tance qui lui est donnee dans la litterature. 


3. Donnees et pretraitement 

Comme nous Favons mentionne dans Fintroduction, le Web permet aujourd’hui 
d’acceder a une tres grande quantite de reseaux complexes representant des systemes 
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reels. Cependant, differents problemes compliquent fortement la constitution d’une 
collection de reseaux de grande taille, qui est un prerequis a F etude a grande echelle 
que nous voulons realiser ici. 

Tout d’abord, la tres grande majorite des ces donnees librement accessibles est 
extremement dispersee, ce qui rend leur exploitation difficile. On les trouve principa- 
lement sur les pages personnelles des chercheurs qui les ont collectees ou analysees, 
ou bien sur les sites de certains editeurs offrant la possibilite d’heberger des fichiers 
annexes que les auteurs peuvent associer a leurs articles. Certains groupes ont en- 
trepris de constituer leurs propres collections de reseaux, ce qui permet de limiter 
ce probleme. On pent ainsi trouver des jeux de test sur les sites de logiciels dedies 
a Fanalyse de reseaux, tels que Pajek* ou Gephi^. Plus recemment, des groupes de 
recherche ont collecte et organise des donnees pour les mettre a disposition de la com- 
munautes, donnant naissance a des depots librement accessibles, tels que Stanford 
Large Network Dataset Collection^ ou Koblenz Network Collection"^. Cependant, ces 
collections restent de taille relativement limitee, de Fordre de la centaine de reseaux. 

Outre la difhculte pratique de la tache consistant a rechercher des reseaux epar- 
pilles sur F ensemble du Web, des problemes d’ordre legal empechent aussi la consti¬ 
tution de grandes collections. En effet, les donnees ne sont pas toutes protegees par 
les memes licences d’utilisation, et Fincompatibilite de certaines d’entre elles rend 
impossible Futilisation d’une licence couvrant Fensemble de la collection. De plus, 
certains auteurs ou institutions refusent que leurs donnees soient hebergees ailleurs 
que sur leur propre site. 

Enhn, le dernier probleme est technique : il n’existe pas de format standard pour la 
representation des reseaux. Ou plutot, il en existe un grand nombre, chacun avec ces 
specihcites. Le format le plus simple, souvent appele edgelist, consiste a representer 
la liste des liens du reseau, sous la forme de paires de noeuds. Cependant, ce format 
ne permet pas de representer une information riche, comme par exemple des attributs 
nodaux, ou la dimension temporelle. Pour resoudre ce type de limitation, chaque outil 
propose done son propre format, comme par exemple Gexf pour Gephi, voire plusieurs 
formats differents, comme e’est le cas pour Pajek. En raison de cette heterogeneite, 
la constitution d’une collection requiert, en plus du travail de collecte, d’effectuer 
une normalisation du format de stockage des donnees, ahn de pouvoir leur appliquer 
ensuite un traitement automatise. 

En raison des trois difhcultes invoquees precedemment, nous avons decide dans 
un premier temps de constituer une collection limitee, qui sera ensuite enrichie itera- 
tivement, et dont F organisation sera eventuellement modihee en fonction des retours 
issus de son utilisation. Lors de cette premiere passe, nous avons recueilli un total 
de 611 reseaux, en tirant principalement parti des collections mentionnees ci-dessus. 


1. http://pajek.imfm.si/ 

2. https://gephi.org/ 

3. http://snap.stanford.edu/data/ 

4. http://konect.uni-koblenz.de/ 
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et en completant avec des donnees eparses. En ce qui concerne le stockage de ces 
donnees, nous avons opte pour deux formats. Pour des reseaux que nous qualifions 
de basiques, dans le sens ou ils sont seulement decrits par leur structure meme, avec 
eventuellement des liens orientes, nous avons utilise le format . net de Pajek, qui est 
compact mais suffisant. Pour des reseaux plus riches, possedant par exemple des at- 
tributs nodaux, des liens ponderes, ou bien des types de noeuds ou de liens distincts, 
nous avons utilise Graphml, qui est un dialecte XML beaucoup plus verbeux que le 
format de Pajek, mais dont le pouvoir expressif est en contrepartie bien plus grand. 
Ces deux formats offrent I’avantage d’etre compatibles avec un grand nombre d’outils 
differents. 

L’ensemble des fichiers obtenus constitue la version complete de notre collection. 
Cependant, pour le travail d’analyse qui nous interesse ici, nous n’avons besoin que de 
reseaux basiques. Nous avons done produit une version partielle de notre collection, 
contenant une version de chaque reseau debarrassee de toute information superflue. 
Pour la plupart des reseaux concernes, il s’agissait simplement de supprimer les orien¬ 
tations ou les poids des liens. Parmi les reseaux nettoyes, une centaine sont bipartis : 
nous avons alors calcule les deux projections possibles et garde la moins dense (pour 
minimiser le fait que ces projections aboutissent a des reseaux plus denses). II existe 
egalement une cinquantaine de reseaux multiplexes ; nous avons conserve seulement 
un type de liens, en privilegiant celui qui permettait d’obtenir le reseau le moins dense, 
tout en etant connecte. II faut souligner que ces transformations sont critiquables, car 
on pent argumenter qu’elles sont susceptibles d’affecter les proprietes topologiques 
qui nous interessent. Nous avons neanmoins decide d’inclure ces reseaux dans nos 
donnees, car e’est I’approche admise dans la litterature, et ce des les travaux fonda- 
teurs precedemment mentionnes [WAT 98, BAR 99]. Nous projetons d’etudier plus en 
detail I’effet de ces transformations quand le nombre de reseaux bipartis/multiplexes 
dans notre collection sera suffisant. La derniere modification a consiste a supprimer les 
noeuds isoles (noeuds de degre nul), les liens multiples (plusieurs liens entre la meme 
paire de noeuds) et les boucles (lien connectant un noeud a lui-meme). Enfin, nous 
avons egalement filtre les reseaux les plus grands, qu’il nous etait impossible de trai- 
ter pour des raisons computationnelles. Au final, notre collection nettoyee comporte 
598 reseaux basiques, tous au format Pajek. 

Pour les raisons invoquees precedemment, il nous est impossible de placer directe- 
ment ces donnees en ligne. Cependant, la liste des reseaux concernes, avec une breve 
description et un lien vers les donnees originales, est disponible sur notre site^. 


4. Evaluation des proprietes 

Depuis les deux travaux fondateurs de la fin des annees 90 mentionnes prece¬ 
demment [WAT 98, BAR 99], les methodes proposees pour caracteriser les proprietes 
petit-monde et sans-echelle ont significativement evolue, pour aller vers plus d’objec- 


5. http://bit.gsu.edu.tr/compnet 
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tivite et de fiabilite. Nous decrivons dans cette section les methodes que nous avons 
adoptees pour ce travail, et qui sont, a notre connaissance, les plus adequates. 


4.1. Mesure petit-monde 

Comme explique en section 2.1 , un reseau est dit petit-monde si sa distance moyenne 
et sa transitivite sont respectivement du meme ordre de grandeur que celles mesurees 
pour un reseau aleatoire et un treillis de dimension comparable. Pour mesurer cette 
propriete, nous avons decide de nous baser sur la methode proposee par Telesford et 
al. [TEL 11], qui consiste a comparer la distance moyenne L et la transitivite T du 
reseau considere G, avec les valeurs La et Tt correspondant respectivement a la dis¬ 
tance moyenne et a la transitivite mesurees pour un reseau aleatoire Ga et un treillis 
Gt consideres comme comparables a G. La mesure uj quantifiant la propriete petit 
monde est alors [TEL 11]: 


tc(G) 


I^_T_ 
L Tt 


[ 1 ] 


Pour un reseau se rapprochant d’une structure de treillis, on a L > La et T ~ Tt, 
done on obtient une valeur negative. Au contraire, pour un reseau dont la distance 
moyenne et la transitivite ressemblent a celles d’un graphe aleatoire, on a L ~ La et 
T < Tt, done la valeur de w est positive. Enfin, si le reseau est petit-monde, alors 
on a simultanement L ~ La et T ~ Tt, et uj est proche de zero. II faut remarquer 
que le fait de combiner les deux rapports pour obtenir une mesure unique n’est pas 
forcement pertinent, car d’autres combinaisons de L et T peuvent aboutir a des va¬ 
leurs similaires, entrainant une interpretation erronee. Par exemple, prenons un reseau 
regulier correspondant a une simple grille carree en 2D. Cette structure possede une 
distance moyenne tres elevee, et une transitivite nulle, ce qui entraine que les deux 
rapports sont quasi-nuls, et done w ~ 0. Or, ce reseau n’est pas du tout petit-monde, 
bien au contraire. Pour cette raison, il nous parait judicieux de considered en plus de 
la mesure uj, les deux termes qui la composent. 

II faut ajouter que les deux reseaux de reference Ga et Gt sont en fait des ap¬ 
proximations obtenues par recablage de G, via deux methodes legerement differentes 
[TEL 11]. Dans les deux cas, il s’agit de repeter un grand nombre de fois un traite- 
ment consistant a selectionner aleatoirement deux liens et de permuter leurs noeuds 
de destination. La qualite de Tapproximation depend du nombre d’iterations. Notons 
V I’ensemble des noeuds de G et G celui de ses liens. Considerons deux liens (a, h) 
et (c, d) G E (oil a, b, c et d G V) : ceux-ci deviennent (a, d) et (c, b) apres permu¬ 
tation. Un filtrage adequat des liens tires au sort permet d’eviter de faire apparaitre 
des liens multiples, ou de separer le reseau en plusieurs composants distincts. Dans le 
cas du treillis, la permutation n’est autorisee que si elle permet de rapprocher le lien 
de la diagonale dans la matrice d’adjacence representant le reseau. Autrement dit, en 
supposant que les noeuds sont numerotes de 1 a n = |U|, on cherche a respecter la 
contrainte |a — fi| -f |c — 6| < \a — b\ + \c— d\. 
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4.2. Distribution du degre 


L’identification de la loi theorique gouvernant la distribution de donnees empi- 
riques est une tache plus delicate qu’il n’y parait. Plusieurs travaux recents on souli- 
gne le fait que les methodes les plus repandues dans la litterature ne sont pas toujours 
appropriees, et ont abouti a des conclusions erronees [CLA 09]. Ceci est particuliere- 
ment vrai de la loi de puissance, qui pent etre confondue avec d’autres distributions a 
queue lourde par certains outils traditionnellement utilises. De plus, certaines donnees 
peuvent suivre ce type de distribution de fa^on partielle, i.e. seulement sur une partie 
de I’intervalle considere. Dans le contexte des reseaux complexes, les caracteristiques 
associees a la propriete sans-echelle sont issues de la probabilite relativement elevee 
de voir apparaitre des pivots dans le reseau. II est done important de s’assurer que 
le degre suit bien une loi de puissance, et non pas une distribution dont la queue est 
lourde mais decroit plus rapidement (distributions exponentielle, exponentielle etiree, 
log-normale, loi de puissance tronquee par une coupure exponentielle), voire qui ne 
possede pas du tout de queue lourde (loi de Poisson). Cette remarque vaut egalement 
si on veut valider I’hypothese que le systeme etudie a ete genere selon un modele tel 
que celui de Barabasi & Albert, qui aboutit a la propriete sans-echelle. 

Pour eviter ce type de confusion, nous utilisons la procedure proposee par Clauset 
et al, qui comprend trois etapes. La premiere consiste a estimer les meilleures valeurs 
pour les parametres a et Xmin de la loi, en utilisant la methode du maximum de vrai- 
semblance. Le premier parametre est I’exposant de la loi, qui a deja ete mentionne en 
section 2.2. Le second est sa borne inferieure, qui correspond a la valeur a partir de 
laquelle on considere que les donnees analysees suivent une loi de puissance. Dans 
la deuxieme etape, on effectue un test d’ajustement, pour verifier s’il est plausible 
que les donnees considerees suivent la loi de puissance munie des parametres estimes. 
Pour cela, on genere d’abord de nombreux jeux de donnees en utilisant a et Xmin, 
puis on estime leurs propres parametres. La statistique de Kolmogorov-Smirnov est 
ensuite utilisee pour mesurer les distances entre les distributions empiriques de ces 
jeux de donnees et les lois theoriques correspondantes (chacune etant caracterisee par 
les parametres estimes). La valeur-p du test d’ajustement correspond a la proportion 
de jeux pour lesquels on obtient une valeur de cette statistique superieure a celle calcu- 
lee pour les donnees originales. La troisieme etape vise a comparer la loi de puissance 
a des distributions alternatives. Cette derniere etape est souvent ignoree dans les tra¬ 
vaux cherchant a identifier la propriete sans-echelle, qui ne cherchent pas a verifier 
si d’autres distribution sont aussi plausibles que la loi de puissance. Pourtant, meme 
si la valeur-p obtenue a la deuxieme etape est suffisamment petite pour que la loi de 
puissance constitue une hypothese plausible, il est possible que les donnees soient 
aussi bien, voire mieux, ajustees par d’autres distribution. On effectue la comparaison 
grace au test du rapport de vraisemblance, qui consiste a comparer les vraisemblances 
des donnees etudiees, relativement aux deux distributions theoriques considerees. Le 
signe du logarithme de leur rapport indique laquelle des deux distributions doit etre 
privilegiee (une valeur proche de zero correspondant a une absence de preference). De 
plus, une valeur-p est calculee pour mesurer la signification de ce rapport. Le resultat 
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final pent done soil privilegier la loi de puissance estimee, soil identifier une ou plu- 
sieurs distributions alternatives comme plus vraisemblables, soit ne pas departager la 
loi de puissance et certaines alternatives. 

5. Resultats 

Comme explique en section 4.1, nous avons d’abord calcule les distances moyennes 
L et transitivites T des reseaux reels constituant notre collection, ainsi que les valeurs 
La et Tt de leurs versions recablees. Avec la bibliotheque igraph® , on obtient pour 
les mesures des complexites en 0(n(fc)^) pour la transitivite et 0{mn) pour la dis¬ 
tance moyenne, ou n = \V\, m = \E\ et (fc) denote le degre moyen du reseau. Le 
recablage d’une paire de lien est effectue en 0{m + n), cependant pour obtenir de 
bonnes approximations, il doit etre repete de tres nombreuses fois, ce qui, en pra¬ 
tique, aboutit a des temps de calcul pouvant etre relativement longs. Pour ces raisons 
computationnelles, il ne nous a ete possible de calculer w que pour 285 reseaux de 
notre collection. L’histogramme presente dans la Figure 1 resume les resultats obte- 
nus. Telesford et al. [TEL 1 1] considerent que les reseaux pour lequels oj se situe dans 
[—0,5; 0, 5] possedent la propriete petit-monde. Pour nos donnees, 65% des reseaux 
traites sont contenus dans cet intervalle, et un test de normalite montre que la mesure uj 
suit approximativement une loi normale centree sur 0. Cela signifie notamment qu’il y 
a a peu pres autant de reseaux penchant vers les graphes aleatoires que vers les treillis. 

Le nuage de points presente dans la Ligure 1 detaille les valeurs des deux termes 
formant cj (cf. eq. 1). Les courbes de niveaux delimitent les valeurs uj = —0,5; 0 
et 0, 5. Les couleurs et formes representent les resultats concernant la propriete sans- 
echelle, que nous discutons ci-apres. On pent observer sur ce graphique qu’aucun re¬ 
seau ne correspond au cas particulier mettant en defaut F interpretation de oj (les deux 
termes nuls), que nous avions identihe en section 4.1 . Un groupe tres dense apparait 
vers la coordonnee (0,8; 0), qui correspond a une collection de reseaux metaboliques 
presentant une transitivite nulle en raison de leur structure quasi-arborescente. Pour 
72% des reseaux, on a 0, 9 < La!L < 1,1, ce qui signihe que les reseaux tendent 
a avoir une distance moyenne tres proche de celle de leur version randomisee. De fa- 
9 on generale, les reseaux ont tendance a presenter une distance moyenne plus petite 
(80% d’entre eux). La dispersion est plus importante pour la transitivite, puisqu’on 
a 0, 5 < T/Tt < 1, 5 pour 67% des reseaux. Ceci indique done une tendance plus 
importante a s’eloigner de la transitivite obtenue sur leurs versions randomisees. On 
pent aussi remarquer qu’a la difference de la distance, les ecarts observes sont repartis 
de fa 9 on relativement similaire des deux cotes de la valeur 1. 

Les tests concernant la distribution du degre sont moins complexes, calculatoire- 
ment parlant, et ont pu etre menes sur 510 reseaux. Nous avons utilise la nomenclature 
de Clauset et al. [CLA 09], qui distingue les situations suivantes : Improbable (la dis¬ 
tribution ne suit probablement pas une loi de puissance), Modere (la loi de puissance 
ajuste bien les donnees, mais e’est aussi le cas d’autres distributions). Probable (la loi 


6. http://igraph.org/ 
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Figure 1 - Resultats pour la propriete petit-monde : frequences de la mesure cu 
(gauche) et valeurs de ses deux composantes La/L et T /Tt (droite). 


de puissance est la seule a bien ajuster les donnees) et Coupure (loi de puissance tron- 
quee par une coupure exponentielle est la meilleure alternative). La loi de puissance 
est la seule alternative probable pour 55% des reseaux testes (niveau Probable), alors 
que pour 1% elle est une alternative parmi d’autres (niveau Modere). Pour 28% des 
reseaux testes, le degre suit probablement une loi de puissance tronquee (niveau Cou¬ 
pure), et les reseaux qui ne suivent probablement pas une loi de puissance representent 
16% (niveau Improbable). Au total, on a done 44% de reseaux dont le degre peut etre 
caracterise par une echelle type, et qui ne possedent done pas la propriete sans-echelle. 
Ce resultat est en contradiction avec I’hypothese d’omnipresence de cette propriete 
parmi les reseaux complexes. 

Le nuage de points inclus dans la Figure 1 indique les resultats relatifs a la dis¬ 
tribution du degre a Faide d’un code de couleur. On peut remarquer que les reseaux 
de niveau Improbable semblent groupes dans la zone du graphique comprise entre 
u) = —0, 5 et 0.5, mais ceci pourrait etre du au faible nombre de reseaux concernes. 
Pour les niveaux Probable et Coupure (rappelons que la propriete sans-echelle n’est 
pas valide pour le second), la distribution est sensiblement similaire, avec la meme 
concentration autour du point (1; 1). Cela semble indiquer que, sur ces donnees, les 
proprietes petit-monde et sans-echelles ne sont pas bees. 

L’analyse de la relation entre la nature du systeme modelise et la presence (ou 
r absence) des deux proprietes qui nous interessent constitue un autre point interes- 
sant. Dans les articles portant sur Fanalyse d’un nombre suffisamment important de 
reseaux, il est frequent de voir les auteurs tenter de faire des regroupements, afin de 
generaliser leurs resultats. Ces groupes sont generalement bases sur les systemes mo- 
delises. Par exemple, les reseaux ayant trait au fonctionnement des etre vivants sont 
regroupes sous le nom de reseaux biologiques, les services de reseautage en ligne sous 
le nom de reseaux sociaux, etc. [ALB 02, NEW 03]. Nous avons fait de meme avec 
nos donnees, et la Figure 2 donne une representation graphique des principales classes 
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definies. On pent voir que certaines occupent des zones bien specifiques de I’espace : 
reseaux biologiques, reseaux d’interactions sociales, reseaux trophiques. Cependant, 
ce n’est pas vrai pour d’autres : reseaux bibliographiques, institutionnels et de pro¬ 
grammes. La question demande a etre creusee, et nous pensons nous orienter vers des 
classes de relations plutot que de systemes ; interaction, similarite, reference, apparte- 
nance, etc. 



UL 


Figure 2 - Distribution des classes de systemes. 


6. Conclusion 

Dans le travail presente ici, nous nous somme concentres sur la constitution d’une 
collection de reseaux, et sur 1’application de methodes recentes afin d’eprouver I’hy- 
pothese d’omnipresence des proprietes petit-monde et sans-echelle, qui apparait tres 
frequemment dans la litterature. Nos resultats, pour I’instant partiels, montrent que si 
la propriete petit-monde est effectivement presente dans une large majorite de reseaux, 
avec toutefois des fluctuations non negligeables en termes de distance moyenne et de 
transitivite, en revanche pres de la moitie des reseaux testes ne possede pas la propriete 
sans-echelle. 

Le but de cet article etait de presenter la premiere etape d’un projet a plus long 
terme, visant a analyser de fa^on systematique une grande quantite de reseaux com¬ 
plexes reels. L’idee est de generaliser les travaux fondateurs de Watts & Strogatz 
[WAT 98] et de Barabasi & Albert [BAR 99], qui se concentraient sur un petit nombre 
de reseaux et de mesures topologiques. La quantite de donnees librement accessibles 
est beaucoup plus importante aujourd’hui, et de nombreuses mesures ont ete propo- 
sees depuis, aussi nous nous proposons d’exploiter ces ressources pour mettre a jour de 
nouvelles regularites du meme type que les proprietes petit-monde et sans-echelle. La 
suite directe de se travail consistera a explorer la relation entre ces deux proprietes : 
sous quelles conditions les reseaux sans-echelle sont-ils aussi petit-monde ? A plus 
longue echeance, nous souhaitons etendre notre etude en termes de donnees et d’outils. 
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D’abord en completant notre collection de reseaux, puis en calculant les autres princi¬ 
pals mesures topologiques existantes : centralite, modularite, etc. II sera vraisembla- 
blement necessaire d’appliquer des methodes d’analyse et de fouille de donnees pour 
detecter des regularites, soit valables pour toute la collection, soit caracteristiques de 
certaines classes de systemes. 
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